# import pandas as pd
# pd.set_option('display.unicode.east_asian_width', True)
# df = pd.DataFrame({'职业':['教师', '司机', '编辑'], '城市':['北京','青岛', '武汉']})
# print('原始数据：\n', df)
# print('编码后的数据：\n', pd.get_dummies(df))
# print('设置附加前缀指定列编码后的数据：\n', pd.get_dummies(df, prefix='居住地', prefix_sep='-', columns=['城市']))







import numpy as np
import pandas as pd
arr = np.random.randint(1, 100, 5)
print('一维原始数据：\n', arr)
print('等差分段离散化数据：\n', pd.cut(arr, bins=5))
print('自定义分段离散化数据：\n', pd.cut(arr, bins=[0, 20, 40, 60, 80, 100]))
print('自定义分段离散化数据，并设置分段标签：\n', pd.cut(arr, bins=[0, 20, 40, 60, 80, 100], labels=['0+', '20+', '40+', '60+', '80+']))